AI资讯新闻榜单内容搜索-Llama 3

全球首个芯片设计开源大模型诞生！5年重塑5000亿美元半导体行业

全球首个芯片设计开源大模型SemiKong正式发布，基于Llama 3微调而来，性能超越通用大模型。未来5年，SemiKong或将重塑价值5000亿美元的半导体行业。

来自主题: AI资讯

11200 点击 2024-07-10 18:14

来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架，简化了原本需要多个模型的复杂的RAG流水线，用微调的方法交给同一个LLM完成，结果同时实现了模型在RAG任务上的性能提升。

来自主题: AI技术研报

6423 点击 2024-07-09 15:50

导读：时隔4个月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上，以27B的参数击败了许多更大规模的模型，甚至超过了70B的Llama-3-Instruct，成为开源模型的性能第一！

来自主题: AI资讯

10654 点击 2024-07-02 11:20

可在单张A100/H100 GPU或TPU主机上高效运行全精度推理。

来自主题: AI资讯

7442 点击 2024-06-29 11:32

如何无痛玩转Llama 3，这个手把手教程一看就会！80亿参数推理单卡半分钟速成，微调700亿参数仅用4卡近半小时训完，还有100元代金券免费薅。

来自主题: AI资讯

10200 点击 2024-06-26 18:18

是时候把数据Scale Down了！Llama 3揭示了这个可怕的事实：数据量从2T增加到15T，就能大力出奇迹，所以要想要有GPT-3到GPT-4的提升，下一代模型至少还要150T的数据。好在，最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了，但你有卡吗？

来自主题: AI技术研报

9859 点击 2024-06-24 15:25

只要1/200的参数，就能让大模型拥有和GPT-4一样的数学能力？来自复旦和上海AI实验室的研究团队，刚刚研发出了具有超强数学能力的模型。它以Llama 3为基础，参数量只有8B，却在奥赛级别的题目上取得了比肩GPT-4的准确率。

来自主题: AI技术研报

11138 点击 2024-06-17 23:35

阿里云发布最强开源大模型Qwen2，干翻Llama 3，比闭源模型还强。

来自主题: AI技术研报

10577 点击 2024-06-09 11:06

开源大模型全球格局，一夜再变。

来自主题: AI技术研报

10312 点击 2024-06-08 19:56

众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最先进的开源 LLM 的预训练数据集也不公开，人们对其创建过程知之甚少。

来自主题: AI技术研报

10304 点击 2024-06-04 17:45